팀 프로젝트 : 코로나 시국에 따른 서울 시민 소비문화 변화 추이

01) 이용건수 소계 데이터 셋 불러오기

02) 월별 공공 자전거 총 이용 건수

02) 소계 데이터셋으로 카운트플롯 사용하는 것은 잘못된 접근

03) 월별 공공 자전거 남성 이용 건수 ( 선 그래프 )

03) 월별 공공 자전거 남성 이용 건수( 막대그래프 )

04 )데이터 셋 불러오기 : 2020년 공공자전거 이용정보

05) 데이터 전처리 : 필요없는 컬럼 삭제

06) 데이터 전처리 : 남녀 성별 컬럼의 결측치 처리 및 값 통일

07) 월별 공공 자전거 총 이용건수 ( 데이터 셋: 2020년 )

07-2) 한 사람당 월별 평균 이용건수 ( 데이터 셋: 2020년 )

08-1) 성별 공공 자전거 총 이용건수 ( 데이터 셋: 2020년 )

08 결론) 성별을 알수없는 이용객이 2배이상 많아서 성별로 구분하는 것은 어려울 듯 하다.

08-2) 성별 공공 자전거 한 사람당 평균 이용건수 ( 데이터 셋: 2020년 )

09-1) 성별에 따른 월별 총 이용건수 ( 데이터 셋: 2020년 )

09-2) 성별에 따른 한 사람의 한달 평균 이용건수

09) 자전거 이용자 중, 여성들은 한달에 20번정도, 남성들은 한달에 25번 정도 공공자전거를 이용한다.

10) 성별에 따른 한 사람 평균 이용시간 차이

10 결론) 알수없는 성별의 케이스가 너무 많아서 부정확하다.

11-1) 성별에 따른 운동량 - 데이터 전처리

map 이용시 주의 사항!!!!!!!!!

11-2) 성별에 따른 한 사람 평균 운동량 차이 - 그래프 시각화

12) 성별에 따른 이용시간 대비 운동강도 : 운동량 / 이용시간

13) 성별에 따른 한 사람 평균 이동거리

14) 성별에 따른 주행속도 차이 : 이동거리 / 이용시간

15-1) 나이대별 총 이용건수

15-2) AGE_03부터 시작함. 따라서 AGE_01부터 AGE_09까지 sort_values 한 후 시각화하면 x labels이 정렬될듯?

16) 나이에 따른 한 사람의 평균 이용시간

17) 나이대 별 성별 차이

18) 나이대 별 한 사람의 한달 평균 이용건수

19) 월별 총 이용시간

19 결과) 잘못된 그래프, 이용자 수임. 한 이용자가 30번을 이용해도 1번으로 count됨.

20) 월별 한 사람 평균 이용시간

21) 월별 한 사람 평균 이동거리

20) iplot으로 그래프 그리기

-> dataframe 형식이 필요해서 dictionary로 만들고, 만든 dictionary로 dataframe을 생성

-> 기존의 data set으로 하게 될 경우, 9만개의 데이터가 일일이 y값에 찍히기때문에 굉장히 오래걸리고, 꺾은선 그래프도 그려지지 않는다.

-> seaborn의 plot은 꺽은 선 그래프에 짙은 실선과 면적을 통해서, 중앙값과 편차값을 동시에 표현한다.